R para Ciencia de Datos en Salud:
Análisis Descriptivo e Inferencia Estadística
Percy Soto-Becerra M.D., M.Sc(c)
InkaStats Data Science Solutions | Medical Branch
@github/psotob91
Es toda característica que se desea observa, medir o evaluar en las unidades de estudio.
Se pueden clasificar de varias formas.
Dos clasificaciones son importantes porque pueden tener implicancias estadísticas:
Basada en la naturaleza de la variable
Basada en su escala o nivel de medición
Son aquellas cuyos valores pueden ser expresados en forma numérica.
También llamadas cuantitativas.
Pueden ser continuas o discretas
Continuas
Discretas
Son aquellas que proporcionan datos expresados como categorías.
También llamadas cualitativas.
Pueden ser dicotómicas o politómicas.
Dicotómicas o binarias
Politómicas o multinomiales
| Nivel | Características | Ejemplo |
|---|---|---|
| Nominal | Solo distingue nombres. | Tratamiento recibido, color de ojos, de cabello, etc. |
| Ordinal | Distingue nombres y orden. | Nivel de dolor |
| Intervalo | Distingue nombres, orden y proporciona 'intervalo' de diferencia entre valores. | Temperatura en grados Celsius |
| Esto implica que cero sea relativo: No indica ausencia, si no que es arbitrario. | ||
| La razón o división no tiene sentido, la resta sí. | ||
| Razón | Distingue nombre, orden, proporciona 'intervalo' de diferencia entre valores y el cero es absoluto. | Peso, talla, etc. |
| Esto implica que la diferencia y la razón tienen sentido. |
| Tipo | Nominal | Ordinal | Intervalo | Razón |
|---|---|---|---|---|
| Dicotómicas | Diabetes(tiene vs. no tiene) | No aplica | No aplica | No aplica |
| Politómicas | Tipo de Establecimiento de Salud (MINSA vs. EsSalud vs. FFAA/PNP vs. Privado) | Nivel de dolor (Leve, Moderado, Severo) | No aplica | No aplica |
| Discretas | No aplica | Escala de valoración numérica de dolor | Coeficiente intelectual (debate) | Número de casos COVID-19 |
| Continuas | No aplica | Escala visual analógica de dolor | Temperatura en ºC | Hemoglobina en mg/dL |
¡Claro que sí!
Son numéricas porque expresamos números para representarlas.
El orden de estos números importa, sin embargo, no siempre esto alcanza para ser al menos escala de intervalo o razón.
¿Qué se requiere para ser intervalo o razón?
Se llama intervalo porque si tomo dos valores cualesquiera y formo un intervalo y luego tomo otro intervalo del mismo tamaño, pero conformado por dos valores diferentes, ambos intervalos valen objetiva y consistentemente lo mismo.
Ejemplo:
Si Pepe pesa 45 kg y Rosa pesa 50 kg, la diferencia del peso es 5 kg.
Si Juan pesa 49 kg y María pesa 54 kg, la diferencia también es de 5 kg.
Objetivamente hablando, ambas diferencias de 5 kg son exactamente iguales.
5 kg es una métrica física basada en un estándar que es la misma a donde vayas. Por eso, el peso es una variable que cumple los criterios de variable de intervalo.
Además, es de razón porque su cero es absoluto.
Nominal: Duele vs. No duele
Ordinal:
Politómico: Escala de intensidad visual del dolor (Visual Pain Intensity Scale) o “FACES” Scale
Numérica discreta: Escala de valoración numérica de dolor (Numerical Rating Scale / Numerical Pain Intensity Scale)
Numérica continua: Escala visual analógica (Visual Analogue Scale)
Pepe puntua 1 y Rosa puntúa 3:
Juan puntúa 8 y María puntúa 10:
¿Estas diferencias, ambas de 2 puntos, son iguales? ¿Qué es un punto de dolor desde la perspectiva física, concreta, objetivable?
Por eso, aunque se midan en números, su diferencia o intervalo no significan consistentemente lo mismo. La escala visual analógica y la escalade rating numérico son variables numéricas medidas en escala ordinal, no de intervalo.
Descargue la carpeta comprimida variables_tipos y descomprímala.
Abra el archivo quarto variable_tipos.qmd y responda las preguntas.
Compile el archivo quarto.
05:00
Variables y tipos